ลำดับความสำคัญเชิงตรรกะของการตรวจสอบ
การอนุมานทางสถิติมีลักษณะเป็นอยู่แล้ว เงื่อนไข. ข้อสรุปใด ๆ ที่เราได้เกี่ยวกับพารามิเตอร์ $\theta$ จะถูกจำกัดอย่างเข้มงวดโดยสมมติฐานว่าข้อมูลที่สังเกตได้ $s$ ถูกสร้างจากแจกแจงใด ๆ ภายในโมเดลที่เราสมมติไว้ $\mathcal{M} = \{P_\theta : \theta \in \Theta\}$
การประมาณค่า: สมมติว่า $P_{true} \in \mathcal{M}$ และพยายามหาค่า $\theta$ ที่ดีที่สุด (เช่น ค่าความน่าจะเป็นสูงสุด $\hat{\theta}$) มันทำงาน ภายใน ของโมเดล
การตรวจสอบโมเดล: ลดความเข้มงวดของสมมติฐานว่าโมเดลเป็นจริง มันถามว่า ใด ๆ $\theta \in \Theta$ สามารถอธิบายรูปแบบในข้อมูลได้หรือไม่ มันทำงาน บน ของโมเดล
วิกฤติความเกี่ยวข้อง (จุดอันตราย)
หากการแจกแจงจริงที่สร้างข้อมูลอยู่นอกเหนือโมเดลทางสถิติ $\mathcal{M}$ แล้ว $\theta$ จะสูญเสียความหมายทางวิทยาศาสตร์ พวกเราจึงตกอยู่ใน จุดอันตรายทางสถิติ: ความเกี่ยวข้องของข้อสรุปที่ตามมาจะกลายเป็นเรื่องที่ต้องสงสัย เราแท้จริงแล้วกำลังคำนวณคุณสมบัติของความจริงทางคณิตศาสตร์ที่ไม่มีอยู่จริง แทนที่จะเป็นความจริงทางกายภาพ
ตัวอย่าง 9.1.1: โมเดลปกติตำแหน่ง
พิจารณากรณีง่ายที่สุดที่เราสมมติว่า $X_i \sim N(\theta, 1)$
เราคำนวณค่าเฉลี่ยตัวอย่าง $\bar{x}$ ภายใต้โมเดลปกติ $\bar{x}$ เป็นการประมาณค่าที่เหมาะสมที่สุดสำหรับ 'ศูนย์กลาง' ของข้อมูล
สมมุติว่าข้อมูลจริงมีค่าผิดปกติที่รุนแรง หรือมีลักษณะกระจายแบบหางหนา การแจกแจงโคชี. แม้เราจะคำนวณ $\bar{x}$ ได้ตามกลไก แต่มันไม่ได้แสดงศูนย์กลางของแจกแจงอย่างมีนัยสำคัญอีกต่อไป ช่วงความเชื่อมั่นของเราจะแคบมากจนอันตราย นำไปสู่ความมั่นใจผิดพลาด เพราะโมเดลปกติไม่ถูกต้อง